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10 20 30 40 50 60 70 

inputs GTCGACCCACGCGTCCGGGCGCCCCGCGCAGTGCAGGCTGCAGGCGCCGCGCCGAGGAGGCTGCCGCTCT 

iiriii. ••••• 

CAGGTCAGA AACCGATCA 

10 

80 90 100 110 120 130 140 

inputs (SGCTTGCCGCCCCCCGCCGCCGCTGOICACCGGACCCAGCCGCCGTTC^ 

\ •* m • » m ••••« ••••• **IJI«I.I«JI" I t Z ••••• 

G(3CATGGAACTCCCCTTCGTCACT - - -C ACCTGTTCTTGCC -CCTGG TGTTCCTGAC 

20 30 40 50 60 70 

150 160 170 180 190 200 210 

input S GGGCCTGGTGGTGGCCTGGGCGCTCAGCCTGTGGCCAGGGTTCACGGACACCTTCAAi^ 

AGGTCT CT - -GCTCCC - -CCTTTAACCTGGATGAACA-TCACC - *C A CGCCTAT 

80 90 100 110 

220 230 240 ^^^^qC CA^*^ ^'^^ 

T CCCAGGGC CACCAGAA--GCTGAATTTGGATACAGTGTCTTACAACATGTTG^^ 

120 130 140 150 160 170 

290 300 310 320 330 340 

inputs GCAATAAGTGGCTGGTCGTGGGCGCCCCACTGGAAA CCAA-TGGCTACCAGAAGACGGGAiQACGTGT 

• ■ • ••• • ••••••••••• IJJ2,S« ** ••••• • 

GACAGCGATGGAT^ 

180 190 200 210 220 230 240 

350 360 370 380 390 400 

inputs ACAAGTGTCCAGT GATCCACGGGAAC TGCACCAAACTCAACCTGGGAAGGGTCACCCTGTC 



ATCGCTGCCCTGTAGGGGGGGCCCACAATGCCCCATGTGCCAAGGGCCACTTAGGTGACTACCAACTGGG 
250 260 270 280 290 300 . 310 

410 420 430 440 450 460 470 

inputs CAACGTGTCCGAGCGGAAAGACAACATGCGCCTCGGCCTTAGTCTCGCCACCAACCCCAAGG — ACAACA 

AAATTCATCTCATCCTGCTGTGAATATGCACCTGGG- -GATGTCTCTGTTAGAGACAGATGGTGATGGGG 
320 330 340 350 360 370 

480 490 500 510 520 530 540 

inputs GCTTCCTGGCCTGCAGCCCC 'CTCTGGTCTCATGAGTGTGGGAGCTCCTACTACACCACAGGGATGTGTT 



GATTCATGGCCTC-TGCCCCTCTCTGCT 
380 390 400 410 420 430 440 

550 560 570 580 590 600 610 

inputs C " - AAGAGTCAACTCCAACTTCAGGTTCTCCAAGACCGTGGCCCCAGCTCTCC^^ 



CCCGTGTGGATGCTTCAT-TCCAGCCTCAGGGAAGCC-TGGCACCCACTGCCCAA 
450 460 470 480 490 500 510 

620 630 640 650 660 670 680 

inputs ATGGACATCGTCATTGTCCTGGATGGCTCCAACAGCATCTArc^ 

■•*••*•*• ••••••«**■*■••**•••••>******• •••••• ■ 

ATGGATGTTGTCATTGTCTTGGATGGCTCCAACAGCATCTACCCCr^ 
520 530 540 550 560 570 580 

FIG. 3A 



690 700 710 720 730 740 750 

inpucs ATCAACATCCTGAAAAAGTTTTACATTGGCCCAGGGCAGATCCAGGTTGGAGTTGTGCAGTATGGCGAAG 

. i '. i i *• .-«••••, 

GAAGACTGGTAGGGAAACTGTTT - ATTGACCCAGAACAGATACAGGTGGGACTGGTACAGTATGGGGAGA 
590 600 610 620 630 640 650 

760 770 780 790 800 810 820 

* Inputs ATGTGGTGCATGAGTrrcACCTCAACGACTACAGGTCrGTAAAA^^ 

tl.IStZItS III II ... •••• II I 

' bcCCTGTACATGAGTGGTCCCTGGGAGATTTCCGAACGAAGGAAGAAGTGGTG^ 

660 670 680 690 700 710 720 

830 840 850 860 870 880 
inpucs TGAGCAGAGAGGAGGAACAGAGACCCGGACGGCATTTGGCATTGAATTI^^ 

CAGTCGGCGGGAGGGACGAGAAACAAAGACTGCCCAAGCAATAATGGTGGCCTGCACAGAAGGGTTC^^ 
730 740 750 760 770 780 790 

890 900 910 920 930 940 950 

inpucs CAGA .J^GGGTGGAAGGAAAGGAGCCAAGAAGGTGATGATTGTCATCACAGATGGGGAGTC 

..a « •« . • •« • . • • •> 

CAGTCCCATGGGGGCCGACCCGAGGCTGCCAGGCTACTGGTGGTTGTCACTGATGGAGAGTCCCATGA 
800 810 820 830 840 850 860 

960 970 980 990 1000 1010 1020 

inpucs GCCCAGA CCTGGAGAA-GGTGATCCAGCAAAGCGAAAGAGACAACGTAACAAGATATGCGGTGGCC 

, ..•••.■•••**•• 

GAGAGGAGCTTCCTGCAGCACTAAAGGCCTGTGAGGC -TGGAAGA GTGACACGCTATGGGATTGCA 

870 880 890 900 910 920 930 

1030 1040 1050 1060 1070 1080 1090 

inpucs GTCCTGGGCTACTACAACCGCAGGGGGATCAATCCAGAAACTTTTCTAAATGAAATCAAA^ 

*•*•* ••••• •••• •I25I ••••••••••I ** 

GTCCTTGGTCACTACCTCCGGCGGCAGCGAGATCCCAGCTCTTTCCTGAGAGA 

940 950 960 970 980 990 1000 

1100 1110 1120 1130 1140 1150 1160 

inpucs GTGACCCTGATGACAAGCACrrCTTCAATGTCACTGATGAG^ 

;:,;:;i: .::i::::::::t:i:.isissss:tit i z i ti::z it 

GTGATCCAGATGAGCGATTCTTCTTC 

1010 1020 1030 1040 1050 1060 1070 

1170 1180 1190 1200 1210 1220 

inpucs GGGGGACAGAATCTTCAGCCTGGAAGGCACC- - AACA-AGAACGAGACCTCCTTTGGGCTGGAGATGTCA 

,sI«II . , «•••• ••««. •••• ••••••••• >*«»*••■•■«••••••••••• 

AGGAGATCGG Arrrri 'GGCCTTGAAGGGTCCCATGCAGAAAACGAAAGCTCCTTTGGGCTGGAAATGTCT 
1080 1090 1100 1110 1120 1130 1140 

1230 1240 1250 1260 1270 1280 1290 

inpucs CAGACGGGCTTTTCCTCGCACGTGGTGGAGGATGGGGTTCTGCTGGQAGCCGTC 

I z i z I z I z tiz«s *• • i««.ii«****«***« • •••• ••••••••••••• 

CAGATTGGTTTCTCCACTCATCGGCTAAAGGATGGGATTCTTT^^ 

1150 1160 1170 1180 1190 1200 1210 

1300 1310 1320 1330 1340 1350 1360 

inpucs ATGGAGCTGTGCTAAAG-GAGACGAGTGCCGGGAAGGTCATTCCTCTCCGCGAGTCCTACCTGAAA-^A 
• • :it*i:ii,.; t.« i i i i i i » i z i i ::.»t:.c is 

GAGGCTCTCTGTCTATC - ACCGCCnTTTCCCCCCACGAATGGCACIXX^AAG^^ 

1220 1230 1240 1250 1260 1270 
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L370 1380 1390 1400 1410 1420 1430 

inpucs GTTCCCCGAGGAGCTCAAGAACCATGGTGCATACCTGGGGTXCACAGTCACATCGGTCGTG-TCCTCCAG 

GTTCCCCCCTGCACTGCAGAACCATGCAGCCTACCTGGGTTACTCTGTTTCTTC CATGCTTTTGCGG 

1280 1290 1300 1310 1320 1330 1340 

1440 1450 1460 1470 1480 1490 

inpucs GCAGG- -GGCGAGTGTACGTGGCCGGAGCCCCCCGGTTCAACCACACG -GGCAAGGTCATC -CTGTTCAC 
■ • • • •« ** • ** •* ** •••••• ■ • «— 

, GGTGGACGCCGCCTGTTTCTCTCTGGGGCTCCTCGATTTAGACA-TCGAGGAAAAGTCATCGCC^^ 
1350 1360 1370 1380 1390 1400 1410 

1500 1510 1520 1530 1540 1550 1560 

inpucs CATCXrACAACAACCGGAGCC-TCACCATCCACCAGGCTATGCGGGGCO^^ 

• • • mm • • • ••••^ • J.JJJ 1»5**** ** ** •••••••• 

CTTAAGAAAGAT--GGGTCTGTGAGGGTTGCCCAG 

1420 1430 1440 1450 1460 1470 1480 

1570 1580 1590 1600 1610 1620 1630 

inputs GAGTGAAATCACCTCGGTGGACATCGACGGCGACGGCGTGACTGATGTCCTGCTGGTGGGCGCACCCATG 



CAGTGAGCTCTGCCCATTGGATACAGATAGGGATGGAACAACTGATGTCTTACTTGTGGCTGCCCCCATG 
1490 1500 1510 1520 1530 1540 ISSO 

1640 1650 1660 1670 1680 1690 1700 
inpucs TACTTCAACGAGGGCCGTGAGCGAGGCAAGGTGTACGTCTATGAGCTGAGACAGAA CCGGTTTGTTT 

TTC--CT--GGGACCCCAGAACAAGG-AAACAGGACGTGTTTATG-TGTATCTGGTAGGCC»^ 
1560 1570 1580 1590 1600 1610 

1710 1720 1730 1740 1750 1760 

inpucs ATAACGGAACGCTAAAGGATTCA-CA- -CAGTTACC AGAATGCCCGATTTGGGTCCTCCATTGCCT 

• • • *• ••••• 

'H«:TGACCCTCCAAGGAACAC'n'CAGCCAGAACCCCC 

1620 1630 1640 1650 1660 1670 1680 

1770 1780 1790 1800 1810 1820 1830 

inputs CAGTTCGAGACCTCAACCAGGATTCCTACAATGACGTGGTGGTGGGAGCCCCCCTGGAGX^ 



CTCTTCCTGATCTGAACCAAGATGGTTTTGCTGATGTGGCTGTGGGGGCGCCTCTGGAAGATGGGCACCA 
1690 1700 1710 1720 1730 1740 1750 

1840 1850 1860 1870 1880 1890 1900 

inpucs AGGAGCCATCTACATCTTCCACGGCTTCCGAGGCAGCATCCTGAAGACACCTAAGCAGAGAATCACAGCC 
••••• * • • 

GGGAGCACTGTACCTGTACCATGGAACCCAGAGTGGAGTCAGGCCC 

1760 1770 1780 1790 1800 1810 1820 

1910 1920 1930 1940 1950 1960 1970 

inputs TCAGAGCTGGCTACCGGCCTCCAG-TATTTTGGCTGCAGCATCCACGGGCAATTGGACC^^ 



GCC -TCCATGCCACATGCCCTCAGCTACTTTGGCCGAAGTGTGGATGGTCGGCTAGATCTGGATG^ 
1830 1840 1850 1860 1870 1880 1890 

1980 1990 2000 2010 2020 ^ 2030 2040 

GATCTGGTCGATGTGGCTGTGGGTGCCCAGGGGGCAGCCATCCTGCTCAGCTCCCGGCCCATTGTCCA — 
1900 1910 1920 1930 1940 1950 1960 

2050 2060 2070 2080 2090 2100 2110 

inpucs tcaatgccagcctccactttgagccatccaag--atcaacatcttccac:agagac^ 
tctgaccccatcactggaggtgaccccacag^ 

1970 1980 1990 2000 2010 2020 2030 
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2120 2130 2140 2150 2160 2170 2iao 

1 npucs AG<MATGCCACCTGCCTGGCCGCCrrCCrCTGCTTCACGCCCATCTTCC?GGCACCCCATTTC -CA^^ 

CAAGAAGCAGTCTGTCTGACTGCAGCCC^^ 

2040 2050 2060 2070 2080 2090^^^^^ 

219Q 2200 2210 2220 2230 2240 •>->SD 

inputs ACAACTGTT-GGCATCAGATACAACGCCACCATGGATGAGAGG-CGGTATACAC -CGAG-GGCCCACCTG 

, TCMCAATTrrACATGAGGTTCACCGCATCACTGGATCAA'I^^ 
2ia,a 2110 2120 2130 2140 21S0 2160 ^^ 

2260 2270 2280 2290 2300 2310 

inputs GACGAGGGCGGGGACCGATTCACCAACAGAGCCGTACTGCTCTCCTCCGGCauSGA^ 

GGCTCTGGCCAGAG- -CTTGTCCCCTCGGAGGC -TCCGGCTCAG-TGTCGGGAATGTC^ 
2170 2180 2190 2200 2210 2220 ^'"^^J^"^ 

2320 2330 2340 2350 2360 2370 2380 

mpucs ATCAACTTCCATGTCCTGGACACTGCTGACTACGTGAAGCCAGTGACCTTCTCAGTCGAGTArrc 




2390 2400 2410 2420 2430 2440 24S0 

inputs A--GGAC--CCTGACCATGGCCCCATGCTGGACGACGGCTGGCCCACCACTCT-CAGAGTCTCGCrr^ 

• • ' .ij*** • •••• • ^ ^ 

ACAATACTACAAAfiCCAGGGCCT-GTGCTCAATGAGGGCTC^ 

2310 2320 2330 2340 2350 2360 2370 

2460 2470 2480 2490 2500 2510 2520 

inputs TTCTCXSAACGGCTGCAATGAGGATGAGCACTGTGTCCCTCACCrTC^^ 



I • • ■ • • 



TTCT CAA— AGGAT TGTGGCCCTGACAATGAAT--GTCTCAC AG&CCTB- 

2380 2390 2400 2410 ^^^^ 

2530 2540 2550 2560 2570 2580 2590 

inputs CCACGGCCATGGAGTACTGCCAGAGGGTGCTGAGGAAGCCraCGCAGGACTGCTCCGC^^ 

• '•Hi'.:.:.. :::: •• 

GTGCTTCAAGTGAA— TATGGA— CATCAGAGG CTCC AGGAAGGC 

2420 2430 2440 2450 

2600 2610 2620 2630 2640 2650 2660 

inputs CTTCGACACCACAGTCTTCATCATAGAGAGCACACGCCAGCGAGTGGCGGTGGAGGCCACACTGGAGAAC 

C CC».-TTTGTGGTTCGAGGTG-GC- --CGGCGGAAAGTCCnX3^ 

2460 2470 2480 2490 2500 2510 

2670 2680 2690 2700 2710 2720 2730 

inputs AGGGGCGAGAACGCCTACAGCACGGTCCTAAATATCTCGCAGTCA<XJUUVCCTGCAGT^^ 

: : : : . : : : : : : : : . : : : . . ; : . , ; .. . ; ; ; . • . . 

AGAAAGGAAAATGCTTACAATACGAGCCTGAGTATaVTCTTCTCTAGAAACCTCC^^ 
2520 2530 2540 2550 2560 2570 2580 

2740- 2750 2760 2770 2780 2790 2800 

inputs ATCC--AGAAGGAGGACTCAGACGGTAGCATTGAGTGTGT-GAACGAGGAGAGGAGGCTCCAGAAGCAAG 

CTCCTCAGAGAGAGAGCCCAAT - -AAAG-GTGGAATGTItXZCGCCCCTTCTGCTCATGC -CCG GC 

2590 2600 2610 2620 2630 2640 

2810 2820 2830 2840 2850 2860 2870 

inpucs TCTGCAACGTCAGCTATCCCTTCTTCCGGGCCAAGGCC^ 

TCTGCAGTGTOSGGCATCCTGTCTTCCAGACTG^^ 
2650 ?660 2670 2680 2690 2700 2710 
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2880 2890 2900 2910 2920 2930 

Lnpucs CAAATCCATCT -TCCTACACCACCTGGAGATCGAGCTCGCTGCAGGCAGTGACAGTAATGAGCGGGAC AG 



CTGCTCC-TCTCTCCTGAGCCAGGTCTTTGGGAAGCTGACTGCCAGCAGTGACAG- 
2720 2730 2740 2750 2760 2770 



2940 2950 2960 2970 2980 2990 3000 

inputs CACCAAGGAAGACAACGTGGCCCCCTTACGCTTCCACCTCAAATACGAGGCTGACGTCCTCTTCACCAGG 



^ ~CCTGGAGAGAAA— TGGCACCCTT— r CAAGAAAAC ACAGCC CAGA 

2780 2790 2800 2810 

3010 3020 3030 3040 3050 3060 3070 

inputs AGCAGCAGCCTGAGCCACTACGAGGTCAAGCCCAACAGCTCGCTGGAGAQATACGATGGTATCGC^ 

« ♦• •■•««« ** ••• •••• 

- -CCTCAGCCT ACATCCAATATGAGCCCCAC - -CTC -CTG TTCTCTAGT GAGTCTA 

2820 2830 2840 2850 2860 

3080 3090 3100 3110 3120 3130 3140 

inputs CCTTCAGCTGCATCTTCAGGATCCAGAACTTGGGCTTGTTCCCCATCCACGGGATGATGATGAAGATCAC 
«•««• ■••••■••« 

CC CTGCA CC GCT ATGAGGTTCAC 

2870 2880 

3150 3160 3170 3180 3190 3200 3210 

inputs CATTCCCATCGCCACCAGGAGCGGCAACCGCCTACTGAAGCTGAGGGACTTCCTCACGGACGAGGCGAAC 



C CATATGGGAC CCTCC CAGTGGG TCCT GGC 

2890 2900 2910 

3220 3230 3240 3250 3260 3270 3280 

inputs ACGTCCTGTAACATCTGGGGCAATAGCACTGAGTACCGGCCCACCCCAGTGGAGGAACyunT^ 



CCAGAAT - -TCAAAACCACT - -CTCAGGGTTCAGAACCT : AGGCT -GCTATGTG 

2920 2930 2940 2950 2960 

3290 3300 3310 3320 3330 3340 3350 

inputs CTCCACAGCTGAATCACAGCAACTCTGATGTCGTCTCCATCAACTGCAATATACGGCTGGTCCCCAACCA 



GTCAGTGGC CTCATCATCTCA GCC - -CTCCTTC - -CAGCTGT GGC CCA 

2970 2980 2990 3000 

3360 3370 3380 3390 3400 3410 3420 

inputs GGAAATCAATTTCCATCTACTGGGGAACCTGTGGTTGAGGTCCCTAAAAGCACTCAAGTACAAATCCATG 

• •••• «*•■•>•»• • 

••••••• ••••• 

TGGGGGCAATTAC TTCCTAT CACTGT CTCAAGT-CATCAC 

3010 3020 3030 3040 

3430 3440 3450 3460 3470 3480 3490 

inputs AAAATCATGGTCAACGCAGCCTTGCAGAGGCAGTTCCACAGCCCCTTCATCT^ 



- -TAACAATG-CAA-GCTGCATAG TGCAGAACCT GACT GAACCC - 

3050 3060 3070 3080 

3500 3510 3520 3530 3540 3550 3560 

inputs GCCGCCAGATCGTGTTTGAGATCTCCAAGCAAGAGGACTGGCAGGTCCCCATCTG^ 



CCAGGC CCACCTG TG 

3090 3100 

3570 3580 3590 3600 3610 3620 3630 

inputs CACCCTGGGGGGCCTCCTACTGCTGGCCCTGCTGGTCCTGGCACTGTGGAAGCTCGGCTTCTTTAC^ 

C ATCCAGAGGAGCTTC AACACA-C AAA- -C AGACTGAATGGGAGCAATACT -C AGT 

3110r . 3120 3130 3140 3150 
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3640 3650 3660 3670 3680 3690 3700 

inpucs GCCAGGCGCAGGAGGGAGCCTGGTCTGGACCCCACCCCCAAAGTGCTGGAGTGAGGCTCCAGAGGAGACT 

GTCAGGTG - -GTGAGGTGCCA- -CCTTGGGC AGCTGG CAAAGGGGACT 

3160 3170 3180 3190 

3710 3720 3730 2740 3750 3760 3770 

inputs rrGAGTTGATGGGGGCCAGGACACCAGTCCAGGTAGTGTTGAGACCCAGGCCTGTGGCCCCACCGAGC^ 



G AGGTCTC TGTTGGA CTATTG AGGCTG 

\\ 3200 3210 3220 

3780 3790 3800 3810 3820 3830 3840 

inpucs GAGCGGAGAGGAAGCCAGCrGGCTTTGCACTTGACCTCATCTCCCGB^^ 



GTTCACAATGAATTTTTCC - -GAAGAGC -CAAGT - -TCAAGTCCCTGACGGTGGT—CAGCACCTTTGAG 
3230 3240 3250 3260 3270 3280 

3850 3860 3870 3880 3890 3900 3910 

inputs AATGGAACTCAAGCTG G T T TTAAGTGGAACTGCCCTACTGGGAGACTCGG^ 



CTGGGAAC-CGA AGAGGGCAGTGTCCTACAG CTGA CTGAAGC-CT CCC 

3290 3300 3310 3320 3330 

3920 3930 3940 3950 3960 3970 3980 

inputs TAGGGATTTAAAGGGACACCCCTACACACACCCAGGCCCACGCCAAGGCCTCCCTCAGGC^^ 



GTTGGAGTGAGAG CCTCTTG GAGGTG6 

3340 3350 3360 

3990 4000 4010 4020 4030 4040 4050 

inputs GCATTTGCTGCCCCAGCTACTAAGGTGCTAGGAATTCGTAATCATCCCCATCCTC 



TTCAGACCCGGC CTA TCCTCATCTCCCTGTGGATCC 

3370 3380 3390 

4060 4070 4080 4090 4100 4110 4120 

inputs AGGAAGACTGTAAATACGAACCCAATCTGCACACTCCAGGCCTCTAGT^ 



TCATAGGCAGTG TCCTGG GAGGGTTGC 

3400 3410 3420 

4130 4140 4150 4160 4170 4180 4190 

inpucs CAGATCTGAATTCTGCCCTTTTCTCTCACCCATCCCACCCCTCCATTGGCTCCCAAGT^ 

TC -CTGC TTGCTCTC CTTGTCTTCT-GCCTGTGGAAGCTTGG CTTC 

3430 3440 3450 3460 

4200 4210 4220 4230 4240 4250 4260 

inpucs CTTCCCCATAGATAGGCCCCTGGGGCTCCTGAAGAATGAACCCAAGAGCAAa 

TCTGCC(^TAAGAAAATCCCTGAGG AAGAAAAA AGAG-AAGAG-AAGTTGGAG-CAA-T 

3470 3480 3490 3500 3510 3520 

4270 4280 4290 4300 4310 4320 4330 

inputs GOUVGCCAGGGATGAAGAAAGACTCTGAGATGTGGAGACTGATGGCCAGGC^ 



G AATGTAGAATAAGGG-TCTAGAAAGT CCTC -CCTGGCAG CTTTCTTCAA 

3530 3540 3550 3560 3570 

4340 4350 4360 4370 4380 4390 4400 

inputs GACGCTGTCCTGAGATGAGAGGTAGCCGGGCTCTGCACCCACGTGCATTCACATTGACCGCAACTC^ 

•••• •« 

• ••••• «••••••• • • • 

GAGACTTGCATAAAAGCAGAGGTTTGGGGGCTCAG ATG-GGACA-AGAAGCCGCCTCTGG-AC 

3580 3590 3600 3610 3620 3630 
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4410 4420 4430 4440 4450 4460 4470 

inputs ATTCCCCCACCAGCTGCAGCCCCTTGCTCTCAGCTGCCAACCCTCCCGGGTCACTTTT^ 

TATCTCCC CAGACC AGCAGCCTGACTT G--ACTTTTGA -GT-' 

3640 3650 3660 367: 

4480 4490 4500 4510 4520 4530 4540 

inpucs CTCATGGGAAGCATGTGGATGACACAATCCCTGGGGCTGTG-CATTCCCACGTCT^ 

••••••••• ••■ •••••• «••• ••••• 

\ CT~AGGGATGCTGCTGG CTAGAGATGAGGCTTTACCTCAG--ACAAGAAG-AGCTG 

3680 3690 3700 3710 3720 

4550 4560 4570 4580 4590 4600 4610 

izxputs CCCCTAGACATGGACGCACTGGCCTGGCTGCAGCTGGGCAG^^ 

•••••• ••••••• •••• 

CACCAAAAC TAGCCATGCT CCCAC 

3730 3740 



4620 4630 4640 4650 4660 4670 4680 

inpucs CTGTATCACCCCCTCCCTACACACACACACACACACACACACACA^^ 

CT CTGCTTCCC -TCCT~CCTCC5T 

3750 3760 377 

4690 4700 4710 4720 4730 4740 4750 

inpucs CCCGCCAGTGCACAGGGAAGGGCTTGGCCAGCGCTGTTGAGGGGTC^ 

ATC-CTGGTTC CATAGCCAACACTC GGG CTT n^ ' m ' G 

3780 3790 3800 

4760 4770 4780 4790 4800 4810 4820 

inputs CACGTGCAAGGACTCCCGGAGCCTGTGCaGC C T TGG T^ 

••^•••« •■«•••• 

-^GGGTCCTTT TATC CCCAGGA— 

3810 3820 



4830 4840 48S0 4860 4870 4880 4890 

inpucs GTGGTATGACCAGTGATAATGCCCCAAGGACAAGGGGCGTGCCTGGCGCCC^ 



— ATCAATAATT • TTTTTGCC 

3830 3840 



4900 4910 4920 4930 4940 4950 4960 

inpucs TAGTCTTGTTTTGAGGTAGAAATGCAAGGGGGACACATGAAAGGCATCAGTCCCCCTC 



• AGGAAAAAA AAAAGC GGCC GCG-AATTCG 

3850 3860 3870 



4970 4980 4990 5000 5010 5020 5030 

inpucs CCTTTACTGTCGTA ITITX GAAAAATTAAAAATACA^ 



-TATC AAGCT- 

3880 



5040 
inpucs CCGC 



FIG. 3G 



10 20 30 40 50 60 7 

inputs MDLPRGLWAWALSLWPGFTDTFNMDTRKPRVIPGSRTAFFGYTVQQHDISGNKWLVVGAPL^^ 

MELPFVTHLFLPLVFLTGLCSPFNUDEHHPRLFPGPPEAEFGYSVLQHVGG^ 

10 20 30 40 50 60 1 

80 90 100 110 120 130 

inipucs GDVYKCPV--IHGM-CTKLNMRVTLSNVSERKDNMRLGLSIATOT 

N*^ • •••••• • •••• 

GD\rraCPVGGAHNAPCAKGHLGDY 

80 90 100 110 120 130 1< 

140 ISO 160 170 180 190 200 

inpucs MCSRVUSNFRFSKTVAPALQRCQTYMDIVTVLDGSNSIYPWVEVQHFLIOT 

** * ■*■•••■*••**•*■••••••■ • I * • ••••• 

ICARVDASFQPQGSIAPTAQRCPTYMDVnnrVI^ 

150 160 170 180 190 200 21 

210 220 230 240 250 260 270 

inpucs EDWHEFHLNDYRSVKDWEAASHIEQRGGTETRTAFGIEFARSEAFQK- -GGRKGAKKVMIVITDGE: 
• ••• ••«• • • , 

ESPVHEWSLGDFRTKEEVVRAAKOT-SRREGRETKTAQAIMVACTEGFSQSHGGRPEAA^^ 

220 230 240 250 260 270 21 

280 290 300 310 320 330 340 

inpucs DSPDL£KVIQQS£RDNVTRYAVAVLGYYNRRGINP£TFLNEIKYIASDPDDiCHFF£^^ 

DGEELPAALlb^EAGRVTOYGIAVLGHYLRRQRDPSSF^ 

290 300 310 320 330 340 3! 

350 360 370 380 390 400 410 

inputs GDRZFSI£GTK-KNETSFGLEMSQTGFSSHVVEIX:VLLGAVGAYDWMC^^ 



GDRIFGLEGSHAENESSFGLEMSQIGFSTHRLKIXSILFGMVGAYDWGGSVLWL 

360 370 380 390 400 410 4: 

420 430 440 450 460 470 480 

inpucs PEELKNHGAYLGYT^^^SWSSRQGRVYVAGAPRFm^^KVILFTMHNNRSLTIHQAM^ 



PPALQiniAAYLGYSVSSMLLRGGRRLFLSGAPRFRiblG^ 

430 440 450 460 470 480 4 

490 500 510 520 530 540 550 

inpucs TSVDIDGDGVTDVIXVGAPMYFN-EGRERGKVYVYEL-RQNRFVYN^^ 



CPLOTDRDGniTVLLVAAPl^ 

500 510 520 530 540 550 

560 570 580 590 600 610 620 

ilipUCS NQDSYNDVAA/GAPLEDNHAGAIYIFHGFRGSILKTPKQRITASEIATGLQYFGCSIHGQLDLN^ 
••••••••••••« ••••• •••• 

NQDGFADVAVGAPLEDGHQGALYLYHGTQSGVRPHPAQRIAAASMPHALSYFGRSVDGRI^ 
560 570 580 590 600 610 620 

630 640 650 660 670 680 690 

inpucs AVGALGNAVILWSRPWQINASUIFEPSKINIFHRDCKRSGRDATCIJU^ 

•••«• * • ••••••• • 

• •«•«••••• • 

AVGAQGAAILLSSRPIVHLTPSLEVTPQAISWQRIXZRRRGQEAVCLTAALCFQVTSRTPGRWDHQETr 

630 640 650 660 670 680 690 

FIG. 4A 



700 710 720 730 740 750 7( 

inputs YNAraDERRYTPRAHLDEGGDRFTNRAVLLSSGQELCERINFHVLDTA^ 

FTASl^EWTAGARAAFDGSGQ 
700 710 720 730 740 750 760 

770 780 790 800 810 820 8: 

ifipucs MLDIXWPTTIJlVS^^FVNGCNEDEHCVPDLVLDARSDLPTAMEYCQR^ 

VLNEGSETSIQIOWPFSiaX^ RGSRKAP ? 

770 780 790 800 810 

840 850 860 870 880 890 9( 

inputs ESTRQRVAVEATLEmiGEIlAYSTVLNISQSANIiQFASLIQKEDSTC^ 

• «•••••■••••• ***#*«*»•»•• ••«•• ** * 

RGGRRKVLVSTTLENRKEKAY^ 

820 830 840 850 860 870 880 

910 920 930 940 950 960 9' 

inputs AKAKVAFRIJDFEFSKSIFIJfflLEIErJUUSSDSNERDSTi^ 

• ••••••• • « 

'raAKVTTlil^EFSC 

890 900 910 920 930 940 950 

980 990 1000 1010 1020 1030 10' 

inputs PNSSLERYTCIGPPFSCIFRIQNLGLFPIHGMMMKITIPIATRSGNIO-LKIJm 

• ' •••• *«••• • ,S««»»J*«JI.»i» 

PYGTLPV- -GPGPEFTCrTLR^^ 

960 970 980 990 1000 1010 1( 

1050 1060 1070 1080 1090 1100 

inputs EYRPTPVE-EDLRIUVPQLimSNSOWSnOXI-RLVPNQEIl^^ 

• •••• •••• • « • 

EPPGPPVHP£ELQHTNRUIGSin*QCQVVRCKLGQLAKGTCVSVGL^^ 

1030 1040 1050 1060 1070 1080 1( 

1110 1120 1130 1140 1150 1160 1170 

inputs QRQFHSPFIFREEDPSRQIWEISKQEDWQVPIWIIVGSTLGGIiliLIAIXVliALWKL 



GTEEGSVLQLT£ASRWSESLLEWQTRPILISLWILIGSVLGGLT..I.I.AT«T.VF^ 

1100 1110 1120 1130 1140 1150 

1180 

inputs LDPTPKVLE 

EKREEKLEQ 
1160 



FIG. 4B 



iH vo mn in 03 r- ^ a\ o h vo m cm in oo ^ o\o r-i*o 

r-4 rH CM rO 00 iH ^ r-l ^ i-4 m r-4 VO CM SO 



U 
O 
CJ 

O 

< a 
u 

o 
u 
u 

u 
u 
o 
a 

u 

04 CJ 

o 
u 

Q 

O 

o 

u 
u 
o 
a 
o 
u 

o 
o 
a 

a 
a 
u 
u 
a 
o 
u 
u 
u 

a 
o 



o 

O 

o 
a 
a 
u 



a: o 
< 

u 
o 
o 

£- 

u 
^ a 
< 

a 

< 

u 

< 

< 
a 
o 

Eh 

u 

u 
cn C5 
< 



u 
cn CP 

u 

u 
o 
u 
a 

u 
o o 
a 



CJ 

< u 
o 

< u 
o 

Eh 
CO C3 

U 

cu a 
a 

Eh 

u 

<t; 



o 

CJ 
Q < 
O 

< 

o 

< 



C5 

u 

Eh 
U 
CJ 

-I 

a 
o 

S Eh 

04 CJ 

u 

Eh 
O C5 

c:^ 

C3 

> H 

a 
o 



"3 



u 

< 

u 
o o 
o 

o 

v4Eh 

u 
u 



u 
a 
a 

u 

CJ 

-a 

u 

"8 

o 
o 

C3 
CD 
U 

Eh 
U C3 
8h 



Eh 



o 

04 CJ 

u 

CD 

^» 

U 
U 

o 

J €h 

u 
a 

u 

u 

u 
a: a 

CJ 

o 
u 

C5 



a 



< 
a 

CP 

Eh 

<n CJ 

O 
> H 
CP 

-I 

U 

cn a 
E^ 



u 

CO u 

u 

CO C3 
O CP 

o 

Eh 

a CP 
o 

O 
CJ 

u 

COCJ 

u 

04 CJ 

u 
o 

CO CP 
< 

o 
og 

< u 

CP 

CP 
a Eh 

u 

6h 

U 

CO a 
o 

C3 



8 



c:) 

C5 



CO CJ 
Eh 

u 

4: 
a: CP 
< 

CJ 

^% 

CJ 
CO u 

Eh 

u 

> H 
CJ? 

a 

CC CP 

u 

CO U 
Eh 

o 
a CP 

Eh 

C5 

=s 

CJ 
^ CP 
O 

Eh 
Eh O 

-a 

Eh 



CJ 

CO U 

Eh 

a 

CD C5 

a 

Eh 

Q < 
CP 

Eh 

CP 
^» 

M H 
< 

CD 

u 

< 

u 
a < 

CP 
CP 

^% 

u 

Eh 

CD 

u 

u 
a o 

CP 

o: CP 

CD 

u 
u 

CD 
CD 



a 

Eh 

Eh 

CD 



u 

-I 

u 
o 

J Eh 

U 

a 

Cl4 H 

X ^ 
O 

u 

>^ 

CD 

a 

CD 

CD 
>Eh 
CD 

u 

04 CJ 

u 

i 

CO CD 
4j 



CD 

"S 

a 

>^ 

CD 

< CJ 
CD 

o 

CD 

< 

CD CD 
O 

CD 

u 
o 

4: 

CD CD 

o 
a 

CD 

u 

CJ 

U 
U 

CD a 

CD 

u 
a* u 

CJ 

CJ 
CD CD 
CD 

Eh 



< 

to 

2 



m n 



in 00 



<N 00 



u\ o 



n CM 
n o 



vn 00 ^ 
mo m r-i 



C5 
O 

"I 

O 

a 

cn o 
< 

a 
o 

CD 

O 

> 

a 

C3 



5 



< U 

o 
a 
o 

a 

<6 

o 

o 
u 

{J ID 
O 

< 

< a 
a 

u 
a 
< 

a: o 
u 

u 

o 
o 

o o 
a 

4: 

< 
O 

o 



a 
o 
o 

o 
o 

M 6-1 

> H 



24 



o 
o 
a 



a 



u 



o 

o 
cn a 
< 

04:- 
o 

a 

o 
o 

o 

03 4: 
o 

o 

o 

< 

U 

a 

4: 

a 
Q 4: 
o 

a 
x 4: 
u 

u 



u 4: 

4: 

u 

-I 

u 
o 

4j 

o: o 
u 

a 
o o 
a 

a 

o 
a 
a 

< u 

-I 



a 



Du 



U 

a 

a 

o 

u 
cn o 
< 

u 
< u 
a 

a 



cu % 
o 

a 

U 

cn e) 

u 
a 

o 
o 

^8 

u 
u 



8 



Q 4: 

u 
< 

O 
Q < 

a 

o 
.J e 
u 

u 

o 

o 

cu 4: 
o 

og 

o 



4: 
cn u 
e 

cn u 

O 
O 

04: 
a 

o 

cn u 

a 

cu 4: 

CD CD 
CD 

cn o 
a 

cu 4: 

CD 

-I 

CD 



"8 



00 
CD 

tZ 



0> O r-l U> 



in 00 
^ to 



ro vo 
(71 o 

^ in 



in in 



in vo 



tn CO 
in \o 



<n vo 

in 



m vo m vo 
a\o fH vo 
in GO vo 00 



^ U 
CD 



o 

< 
o 

> H 

CD 

a 
o 
u 
o 
u 

-I 

C3 
U 

o 

u 



a 
a 

u 

O 

Da < 
o 

o 

o 

cu u 
a 



''a 

a 
o 

CO O 

o 

cu < 

o 

o 

u 
o 
o 



C3 

> 

o 
o 

CD 

6^ a 
< 

CD 

> H 
a 

CD 

cd8 

CD 

CD 

a: S 
u 

a 



^a 

CD 

a 

CD 

CU < 

CD 

CD 
CU < 

u 



CD 

o 

C5 CD 
CD 

CJ 

u 



a 



o 

u 
u 

CD 

< 
CD CD 
CD 

CD 
^» 

CD 

CD 
tC CD 
O 

CD 
CD CD 
CD 

CD 

U 

CD 
tC CD 
< 

U 
W CJ 
6- 

U 

cn CJ 



CD CD 

a: 8 
u 

CD 
CD 

a 
o 

u 
cn O 
CD 

a: a 
a 



=a 

u 

CD 

u 

ci* 

"I 
>^ 

CD 



cc: o 

CD 

CD 
CD 

a 
cn u 

C^ 

cn CJ 

CD 8 
CD 

"I 

CD 

u 

cu i< 
CD 



CD 

CD 

OS O 
U 

CD 
CU < 
CD 

oc: CD 
a 

u 

CD CD 
CD 

CD 
CU < 
CD 

cn CD 



Cu 



-I 

u 
cu o 
u 

< u 

CD 
CD 

a 

CD 
U 
CD 

CD 



-I 
-I 

CD 
O 

^\ 

u 

-I 



Cu 1^ 
CD 

a 

u 
a: a 

CD 
U 

-I 

u 

> 

o 

> H 
O 

C9 



-I 

o 

CD 

o-a 

u 

>|: 

CD 

cn u 

CD 



a 

U CD 

u 

cn u 

CD 

a 

Cx- 

CD 
DC CD 

u 

u 
< u 

CD 

a 
cn o 

a 

u 

cn u 



<'6 

CD 

CD 
CD CD 
CD 

u 

a 
cn CD 
< 

o 

Q < 
CD 

CU % 

a 

U 

G4 CJ 

u 



8 



CD 
CCD 
CD 

>g 

CD 

CD 

CD 
> H 
CD 

qS 

CD 

-I 

U 

cn CJ 
o 

oa 

CJ 



o: ^ 

CD 

a 

CD 

a 

cu o 

a 

CD 
CD 

a 

-I 

CJ 

o.a 

a 
a 



a CD 



O 

CJ 

oa 

u 

CD CD 
CD 

a 
cn 8 



a 

CD 



CD 

u 



CD CD 

oi a 
u 

o 

at 
u 

t3 
u «i: 

o 
u 

o 



o 

lO 

CD 



m so 
m n 



■*8 

>i 

o 

a 
u 
o 



m so 
in 09 



U 

u 

u 

a 
o 



a 
a 
u 
a 

CO O 

a 



a 
u 



VD o 



U 
U 
U 

o 
< u 
o 

a 

u 

a 
u a 

a 



u 
o 



5 ^3 



u 

=^3 



m sa 
a\ o 

CM 



o 

E- 

a: o 

u 
o 

>^ 

o 
u 

org 

u 



a 
u 

a 

a 



Ci:4 



713 
2166 


733 
2226 


a < 

CP 


u 




u 


o 
o 


o 
< 


rn 


4! 








a 







u 
o 

Q4 U 

o 
u 

4! 



CD 

a c^ 

CD 

t» 

CO u 
E-» 

U 

CO a 

o 
o 
u 



CD 



in 00 
CM 

CM 



a 

C5 
CD 



U 



CO 



u 

CD 

cu u 
U 

CD 

CD 
> 62 
CD 

-I 

U 
Q < 
CD 



CM 



CD 
> e 

a 
a: o 
u 

U 

u 

cu CJ 
u 

_ a 



3 



CD 
CD 
U 
CD 

U 

04 CJ 

a 
a 

CD CD 
CD 

-I 





CD 


CJ 
Q < 

a 


CJ 




ai ^ 
4! 


u 

CD 


o 


o 


04 U 

u 


CD 


u 
o« o 

u 








u 


Mia: 
o 


a 
o: o 
a 


o 


i 




i 


>^ 

o 


u 




CD 










u 


CD 

a 




2 CD 


a 

"5 


a 


-\ 


CD 

u 




a 



o 

IT) 

cji 

iZ 



cn so 
a\ o 

CM 



u 

U 

O 
Q < 
O 

a* o 

u 

>^ 

u 
o 

o 

o 
cu < 

o 

a 
a o 
o 

so 

U 

U 
cu u 
a 

o 

o 

o 
cn u 
6^ 



m U3 

00 ^ 
CM 



o 
u 

o 

a: o 
< 

o 
a o 
o 

a 

u 

o 

> ^ 
o 

o 

u 

u 

u 
u o 

ci] 4: 
o 

=s 

u 
^ u 
a 

-a 

u 
u 
o 
o 
u 

Q < 
O 

< 

a 

<t 



m U3 

ro CM 
03 in 



U 
cn C3 

o 

^% 

u 

U 

o 

< 

o 

u 
cn U 

u 
u 

u 

u 
cn o 
< 

u 
cn u 

u 

o 
a 



in (30 
00 in 



cn 8 

-I 

q 
o 

C5 

a 

O 
> H 

a 

o 

a: o 
a 

OS o 

a 

o 
a: cij 
a 

b 



m KO 

00 u> 
CM 



oS 
o 

u 
o 

"S 

u 

u 
cn a 

a 
a 

CJ 



cu !< 

o 
cno 

CD 

u 

u 
cn u 



a> o 

CM 



u 

U 

a: 

u 
o 

Cx] < 

o 
o 

Ct3 14: 

o 



> ^ 
a 

o 

Cd < 
O 

u 
cn a 

u 



01 U 



m vo 

cn 

CM 



O 
CU i< 

o 
u 

Ct. H 

o 

u 

a: o 
u 

u 

Cx- H 

o 
o 
a 

CD 

O 
C3 



a ^a 



^8 

4: 
u 

Cl4 H 

u 

U 

u 
cn o 



933 
2826 


953 
2886 


cn o 
4; 




O 




cn o 


u 


CJ 
CD CD 
CD 


a 


o 


y 


CD a 

CD 


CJ 
oi CD 

a 


u 


CD 

u 


u 


• • 

CJ 

.J H 
a 




a 


CD 




u 








U 


°i 


CD 
U 


CD 






o 


cn CD 
< 




CD 


CD 


u 


cn CD 
< 


CD 
CU i< 
CD 




X ^ 
U 



m \o 

CM 



o 

CD 

CD 
cum: 
CD 

U 

Cl4 H 

X^ 

u 

CJ 

cn CD 
< 

CD 
CJ 

cn8 
< 

u 
cn CD 
< 

o 
cn CD 

a: CD 

0,1: 

CJ 
CD 
CD 
CD 



CU 



m \o 
a\ o 
a\ o 
cn 



a 

OK* 

u 

CD 
> F» 
O 



u 

-I 



so 
o o 

r-l d 



cu CJ 

u 

-1 



IT) 



p p 

CCT CCG 


M M 
ATG ATG 


FIG. i 


< 


CD 






CD 
CD CD 

a 






X < 

u 




a < 

CD 






^•^ 


u 

0« CJ 
CJ 




a 
cn CD 
< 






CD 








U 
CD CD 
CD 




< 
cn u 


CD 
CJ 




cn CD 
4: 







O r-4 



in 09 

o t-* 



^ ON o 



O CM 



o ro 



r-t fO 



in 00 



m U3 

r-J in 
tr-l ro 



u 



u 

o 
u 

E- 
Q < 
O 

O 



a 
u 



o 
to u 

o 



u 
o 
< 

u 



u 
cn u 

u 

a 
a 



u 

a 

o 
a o 
o 

o 

u 



u 



00 a\ 
r-4 m 



o 
o 


o 

O 


o 
< 


o 


CD 




< 




* o 










CD 


CD 


cn o 


^» 






< 
CU cj 
a 


cn u 




CD 


CD 

a 


CJ 
CD CD 
O 


6^ 
CD CD 

Q 


CJ 




< 




c5 




CD 

u 


CD 


U 


CD 

ru 

CD 






> H 
O 


CD 
> H 

o 


CD 


cn c^ 
< 




a 
< 






o 
*< 


o 


CJ 




04 U 

o 


< 




U 
Oi u 

u 


< 




u 






CD 




CD 

a 


u 
<: 




O 
O 


< 




CD 


CD 


u 


CD 


u 

u 




< 


< 




u 


CD 

a 


O 

Q4 O 

a 




u 

CD CD 
CD 


u 


U 

CO a 


a 




CO U 


a: o 
u 


o 


>^ 


u 


o 
u 


-1 




CD 


CD 
a: CD 
< 


u 


o 
u 


CD 
U 


u 

CD O 
CD 


u 


o 


o 
a: o 


CD 

u 




u 




a 


04 U 

u 


-1 




o 
u 


u 
cn CD 
< 




u 






CD 


a 




u 


u 
u 


u 

O 


CJ 

a 


O 


o 
u 


CD 
a: CD 
< 


a 








CD 


a 
en CD 
< 


a 


o 
a 


CD 


< 




u 


CD 
U 




u 


CD 

"^3 


o 


a: CD 
u 



u. 

IT) 

EE 



m 


(N 


T-4 


o 




CO 






in 










O 




00 




in 






00 






CM 


o 


00 






CM 


o 




in 


\o 






CA 




O 




CM 


m 


n 




in 








00 


n 


m 


n 


m 



























u 
a 
< 

a 

u 
u 
o 
o 

u 
o 

o 
u 
u 
u 
a 
o 

d 

o 



o 

I 

a 
o 
u 
a 
a 

a 

1 



i 

3 

u 
u 

i 



U 

a 
< 

o 

Eh 

o 
o 
o 

o 

a 
o 
a 

o 



u 

CD 

1 

a 

U 

I 

o 



o 

u 
u 
o 
< 

i 



u 



I 

u 
u 
u 

o 
<: 

a 
I 

o 
a 

u 
u 
o 
o 
<: 

^ 

Eh 
o 
< 

U 

o 

I: 
S 

e> 
a 
u 

E-» 

a 
u 
u 

u 



i: 

a 

U 

o 

E- 
O 
O 

U 



u 
u 
a 
u 
o 

E-» 
U 

o 

Eh 

U 

I 

o 
o 
o 
< 

o 

Eh 

O 

Eh 

u 

Eh 

U 
C3 
CD 



a 

CJ 

u 
a 

Eh 

U 

u 

CD 

o 

Eh 

O 

u 

u 
u 

a 

u 



H 
U 

CD 
U 

Eh 
< 
Eh 

O 

u 
u 

CD 

u 

CD 
Eh 

a 

Eh 
U 

u 
u 
u 



a 

CD 
£h 

u 

1 

CD 
CD 
CD 

u 

Eh 

u 



1 

o 

Eh 

a 

Eh 
O 

u 
< 
u 
u 
u 
o 

Eh 
Eh 

a 

Eh 

CD 



8 









CD 


a 




Eh 


CD 






CD 


< 


o 




Eh 


CD 


Eh 


a 


a 




u 


< 


u 


U 


Eh 


u 


Eh 


Eh 


O 


< 


a 


a 


Eh 


a 


CD 


u 


Eh 


< 


CD 




a 




a 




Eh 


< 






U 


CJ 


< 


Eh 


a 






Eh 




CJ 




u 






CD 








CD 




CD 




CD 




O 




Eh 


CD 


u 




CD 


CD 




u 


Eh 


CD 


u 


CD 


CD 


Eh 


Eh 


< 


a 


U 


U 




CD 


u 


CD 




< 


u 


CD 




u 


u 


Eh 






CD 


CD 




% 


a 


CJ 




u 




CJ 




u 




tH 

1^ 


TTTC 


CCAA 


ATGC 




CD 


U 


u 




Eh 


Eh 


u 


Eh 


CJ 


u 


u 








o 


3 


CJ 






en 


U 


u 








CD 








U 




CD 


CD 


< 




a 


U 




CD 




O 


CD 


CD 




u 


Eh 


< 




< 


CJ 


CD 




u 


< 


Eh 


CD 


< 


u 


U 






CD 


U 










Eh 








a 




u 


CD 






CD 


CD 






CD 








< 








Eh 


Eh 






O 


CJ 






Eh 


CD 




u 


tH 


Eh 




< 


U 


CD 


CD 




CJ 


a 


CD 




CD 


Eh 


tH 




CD 




U 




CD 




a 




CD 




u 




CD 


U 


Eh 




CD 


CD 






Eh 








a 




Eh 




Eh 


Eh 


a 




o 


U 






CD 


CD 


s 




U 




a 




CD 


Eh 


CD 




CD 




tH 




CD 


8 






CD 








CD 



Eh 
Eh 

CD 

U 
CD 
< 
U 

u 
u 

CD 

i 

a 
u 
u 

CD 

u 

CD 
CD 
CD 
CD 



Eh 

u 

% 

U 

CD 
Eh 



8 

a 

CD 
CD 

a 

CD 
CD 

ca 



C9 



10 20 30 40 50 60 T 

inputs GTCGACCCACGCGTCCGGGCGCCCCGCGCAGTGCAGGCTGCAGGCGCCGCGCCGAGGAGGCTGCCC3CTC 



80 



90 



100 



110 



120 



130 



U 



xnpucs 



— CGACACCCGCCGCCGC - 
10 



— GCAGCGGGCCATGGACTTTCCC; 
20 30 4( 



inputs 



150 160 170 180 190 200 2! 

GGGCCTGGTGGTGGCCTGGGCGCTCAGCCTGTGGCCAGGGTTCACGGACACCTT^ 



GGGCCrcCTGGTGGCCTGGACCCTCAGCCTTTGGCCAGGATT^ 

50 60 70 80 90 100 111 



220 230 240 250 

inpucs AAGCCCCGGGTCATCCCTGGCTCCAGGACCGCC 



260 270 2[ 

rACACAGTGCAGCAGCACGACATCAG'. 



AATCCCCGGGTCATTGCTGGTCCCAGTGCTGCCTTCTTTGGCTAC^ 

120 130 140 ISO 160 170 18t 

290 300 310 320 330 340 31 

inputs GCAATAAGTGGCTGGTCGTGGGCGCCCCACTGGAAACCAATGGCTACCAGAAGACGGGAGAC 

GCAAGiUyGTGGTTGGTTGTGGGTGCCCCA^ 

190 200 210 220 230 240 2S 

360 370 380 390 400 410 4 

Inpucs GTGTCCAGTGATCCACGGGAACTGCACCAAACTCAACCnt;^^ 

••• ••••«••••••«••■••••«••• ••••«••• ••••• • 

ATGTCCGGTAACCCAGGGCAACTGCACCAAGCTCAACCTXaSGC^^ 

260 270 280 290 300 310 32 

430 440 450 460 470 480 4 

inputs CGGAAAGACAACATGCGCCTCGGCCTTAGTCTCGCCACCAACCCCAW 

AGGAAGGACAACATGCGCCTCGGCCTGAckcTT^ 

330 340 350 360 370 380 39 

500 510 520 530 540 550 5 

inputs GCCCCCTCTGGTCTCATGAGTGTGGGAGCTCCTACTACACCACA 

GcccnricTG^ 

400 410 420 430 440 450 46 

570 580 590 600 610 620 6 

inputs CTTCAGGTTCTCCAAGACCGTGGCCCCAGCTCTCCAA^ 

CTTCAGATTCTO 

470 480 490 500 510 520 53 

640 650 660 670 680 690 7 

inputs CTGGATGGCTCCAACAGCATCTACCCCTGGGTGGAGGTTCAGCACTTCCT^ 

TTAGATGGCrCCAACA<^ 

540 550 560 570 580 590 60 



FIG. 7 A 



710 720 730 740 750 760 770 

mpucs TTTACATTGGCCCAGGGCAGATCCAGGTTGGAGTTGTGCAGTATGGCGAAC^TGTGGTGCATGAGT^^ 
. • •••••••• .« 

z .••irirrirt rirt«*«**»* .••..•« •••••••• » z 

TCTACATTGGCCCCGGCCAGATCCAGGTCGGAATAGTCCAGTATGGAGAAGATGCCGTCCATGAGTTCCA 

610 620 630 540 650 660 670 

780 790 800 810 820 830 840 

inputs cctcaacgactacaggtctgtaaaagatct:ggtggaagctgccagccacattgagcagagaggaggaaca 
ccttaatgactacaggtctgtaaaagatgtggtggaagccgccagccacattgagcagagagqaggg 

U 680 690 700 710 720 730 740 

850 860 870 880 890 900 910 

inpucs gagacccggacggcatttggcattgaatttgcacgctcagaggctt^ 
gagacccgcacggcatttggcattgaatttgcacgctcggaggcto 

750 760 770 780 790 800 810 

920 930 940 950 960 970 980 

inputs ccaagaaggtgatgattgtcatcacagatggggagtcccacga^ 
ccaagaaagtga 

820 830 840 850 860 870 880 

990 1000 1010 1020 1030 1040 1050 

inputs gcaaagcgaaagagacaacgtaacaagatatgcggtggccgtcctgggctactacaaccgc^^ 

••••• • •••••••• ••••• iJjJtJtJ I*«««t**!ttiItStSI2*«****I 

gcagagcgagaaggacaacgt 

890 900 910 920 930 940 950 

1060 1070 1080 1090 1100 1110 112C 

inputs aatccagaaacttttctaaatgaaatcaaatacatcgcca^ 

AATCCAGAGACT^^ 

960 970 980 990 1000 1010 1020 

1130 1140 1150 1160 1170 1180 1190 

inputs tcactgatgaggctgccttqaaggacattgtcgatgccctgggggacagaatcttc^ 

TCAit^GATGAGGCGGCCCTGAAC^ 

1030 1040 1050 1060 1070 1080 1090 

1200 1210 1220 1230 1240 1250 126C 

inputs CAACAAGAACGAGACCnX:CTTTGGGCTGGAGATGTCACAGACGGGC^^ 

::::::::: :::::::: : - : : 

CAAiCAAGAATGAGACC lCn " r TGGGCTGGAGATGTCGCAGACTGGCl^^^ 

1100 1110 1120 1130 1140 1150 1160 

1270 1280 1290 1300 1310 1320 133C 

inputs GGGGTTCTGCTGGGAGCCGTCGGTGCCTATGACTGGAATGGAGCTC^^ 

GGGATCCTGCT 

1170 1180 1190 1200 1210 1220 1230 

1340 1350 1360 1370 1380 1390 140C 

inputs AGGTCATTCCTCTCCGCGAGTCCTACCTGAAAGAGTTCCCCGAGGAGCrc^ 

AGCTGAITCCTCACCGAG^^ 

1240 1250 1260 1270 1280 1290 1300 

1410 1420 1430 1440 1450 1460 147C 

inputs GGGGTACACAGTCACATCGGTCGTGTCCTCCAGGCAGGGGCGAGTCT 

AGGGTACACGGTGACGTCGGTTGTGTCCTC 

1310 1320 1330 1340 1350 1360 1370 



FIG. 7B 



1480 1490 1500 1510 1520 1530 1540 

inpucs AACCACACGGGCAAGGTCATCCTGTTa\CCATGCACAACAACCGGAGCCrCACCATCCACCAGGCTAT^ 



AACCATACTGGCAAGGTCATTCTATTC\GCATGCACAACAACCGGAGCCTCACCATCCACCAG ^ 

1380 1390 1400 1410 1420 1430 1440 

1550 1560 1570 1580 1590 1600 1610 

inputs GGGGCCAGCAGATAGGCTCTTACTTTGGGAGTGAAATCACCTCGGTGGACATCGACG^ 

••••••••••••• «••«••••••••••*«• 22* * *•*•* 

V GGGGCGAGCAGATAGGC 

1450 1460 1470 1480 1490 ISOO ISIO 

1620 1630 1640 1650 1660 1670 1680 

inpucs TGATGTCCTGCTGGTGGGCGCACCCATGTACTTCAACGAGGGCCGTGAGCGAGGCAAGC^^ 

AGATCTGCTGCTGGTG^^ 

1520 1530 1540 1550 1560 1570 1580 

1690 1700 1710 1720 1730 1740 1750 

inpucs GAGCTGAGACAGAACCGGTTTGTTTATAACGGAACGCTAAAGGATTCA^ 

« • •••••••««•»••••■•••••••••• •••••••• •»•••*«• ••*•• • 

AACCTGAGACAGAA 

1590 1600 1610 1620 1630 1640 1650 

1760 1770 1780 1790 1800 1810 1820 

inpucs TTGGGTCCTCCATTGCCTCAGTTCGAGACCTCAACCAGGATTCCTACA^ 

TCGGGTCCTGCATCGCCT^^ 

1660 1670 1680 1690 1700 1710 

1830 1840 1850 1860 1870 1880 189C 

inputs CCTGGAGGACAACCACGCAGGAGCCATCTACATCTTCCACGGCl^ 

TCTGGAGGACAGCCACAGAGGG^ 

1730 1740 1750 1760 1770 1780 1790 

1900 1910 1920 1930 1940 1950 196C 

inpucs AAGCAGAGAATCACAGCCTCAGAGCTGGCTACCGGCCTCCAGTATTTTGGCTGCA^^ 

• •••••••• • !*I rril*««7*t!l**«2**2«*2*»*> 

ATGCAGAGAATAACAGCCTCGGAGCTGGCTCCTGGCCTGCAGCATTTTGG^ 

1800 1810 1820 1830 1840 1850 1860 

1970 1980 1990 2000 2010 2020 203C 

inpucs TGGACCTCAATGAGGATGGGCTCATCGACCTGGCAGTGGGAGCCCTTG 

:::::::::::::::::::::: . : : : : : : ::::::: 

TGGACCTCAATGAGGATGGGCTTGTGGACCTAGCAGTGGGCGCCCTGGGCAACC 

1870 1880 1890 1900 1910 1920 1930 

2040 2050 2060 2070 2080 2090 210C 

inputs CCGCCCAGTGGTrrCAGATCAATGCCAGCCTCCACTTTGAGCCT^TCCA;^ 

CCGCCCTOTAGTTCAAAT^^ 

1940 1950 1960 1970 1980 1990 2000 

2110 2120 2130 2140 2150 2160 217C 

inputs TGCAAGCGCAGTGGCAGGGATGCCACCTGCCTGGCCGCCTTCCTCTGCT^ 

TGCAAGCGCAATGGCAGGQA 

2010 2020 2030 2040 2050 2060 2070 

2180 2190 2200 2210 2220 2230 224C 

inpucs CCCATTTCCAAACAACAACTGTTGGCATCAGATACAACGCCACCAT^ 

!22S *r2222222«*2S* 52 «• •••• • 

CCCACTTCCAAACAGCAACCGTCGGCATCAGGTACAATGCAACC^^ 

2088 2090 2100 2110 2120 2130 2140 



FIG. 7C 



2250 2260 2270 2280 2290 2300 2310 

GGCACATCTGGACGAGGGCGGAGACCAGTTCACCAACAGAGCCGTCCTGCTCTCCTCTGGCC^^ 

2150 2160 2170 2180 2190 2200 2210 

V\ 2320 2330 2340 2350 2360 2370 2380 

inputs' TGTGAGCGGATCAACTTCCATGTCCTGGACACTGC^^ 



TGTCAAAGGATCAACTTCCATGTCCTGQACACTGC^ 

2220 2230 2240 2250 2260 2270 2280 

2390 2400 2410 2420 2430 2440 2450 

inputs ATTCCCTGGAGGACCCTGACCATGGCCCCATGCTGGACGACGGCTGGCCCACCACTC^^ 

ACrCCCTAGAGGACCCTGACAACGGCCCCATGCTGGACAACG 

2290 2300 2310 2320 2330 2340 2350 

2460 2470 2480 2490 2500 2510 2520 

inputs GOrCTTCTGGAACGGCTGCAATGAGGATGAGCACTGTGTC 



QCXCTTCTGGAATGGCrGTAATGAGGATGAACACTGTG^ 

2360 2370 2380 2390 2400 2410 2420 

2530 2540 2550 2560 2570 2580 2590 

inputs CTGCCCACGGCCATGGAGTACTGCCAGAGGGTGCTGAGGAAGCCTGCGCAGGACTGC^ 

•«•••••«•••••••••• • 

CTGCCCACTGCCATGGAGTACTGCCAGCGGGTGCTGGGGAGGCCGGCGCAGGACTGCTCCAGCTACACCC 
2430 2440 2450 2460 2470 2480 2490 

2600 2610 2620 2630 2640 2650 2660 

inputs TGTCCTTCGACACCACAGTCrrCATCATAGAGAGCAC^ 



TGTCCTTCGACACCACTGTCTTCATCATAGAGAGCACGCGCCGCCGGGTGGC^ 

2500 2510 2520 2530 2540 2550 2560 

2670 2680 2690 2700 2710 2720 2730 
inputs GAACAGGGGCGAGAACGCCTACAGCACGGTCCTAAATATCTCGCAGTCAGCAAACCTGCAGTTIOT 

•••«• «« • •••••••••«*• 

GAACAGAGGAGAGAATGC 

2570 2580 2590 2600 2610 2620 2630 

2740 2750 2760 2770 2780 2790 2800 
inputs TTGATCCAGAAGGAGGACTCAGACGGTAGCATTGAGTGTGTGAACGAGGAGAG 



CTGATCCAGAAGGATGACTCAGACAACAGCATCGAGTGTGTGAACGAGGAGAGGCGGC^ 

2640 2650 2660 2670 2680 2690 2700 

2810 2820 2830 2840 2850 2860 2870 

inputs lxritX:AACGTCAGCTATCCCTTCTTCCGGGCCAAGGCC^ 

••••••••• ',*jjjitrjr«**j«*iJ»i»222r*J 

TCTCCAACGTCAGCTACCCCTTCTTCAGAK^ 

2710 . 2720 2730 2740 2750 2760 2770 

2880 2890 2900 2910 2920 2930 2940 

inputs CAAATCCATCTTCCTAOUCCACCTGGAGATCGAGCTCGCTGC^^ 

CJU^TCTGTGTTTCTGCACamnrrCAGATCCATCTGGGTGCCGGCAGTGACACT 

2780 2790 2800 2810 2820 2830 2840 



FIG. 7D 



2950 2960 2970 2980 2990 3000 3010 

inpuCS ACCAAGGAAGACAACGTGGCCCCCTTACGCTTCCACCTCAAATACGAGGCTGACGTCCTCTTCACCAGGA 

ACCGCAGACGATAACACGGCCCTCCTGCGCTTCCACCTCAAATATGAAGCAGACGTCCTCT 

28S0 2860 2870 2880 2890 2900 2910 

3020 3030 3040 30S0 3060 3070 3080 

inputs GCAGCAGCCTGAGCCACTACGAGGTCAAGCCCAACAGCTCGCTGGAGAGATACGATGGTATCGGGCCTCC 

• ••■•••••••••••••a • ••••• ••••• 

V . GCAGCAGCCTGAGCCACTTCGAGGTCAAGGCAAACAGCTCACTTGAGAGCTATGAT^^ 

2920 2930 2940 2950 2960 2970 2980 

3090 3100 3110 3120 3130 3140 315C 

inpucs CTTCAGCTGCATCTTCAGGATCCAGAACTTGGGCTTGTTCCCCATC 



GTTCAACTGTGTTTTCAAGGTGCAGAACCTGGGCTTTTTCCCC^ 

2990 3000 3010 3020 3030 3040 3050 

3160 3170 3180 3190 3200 3210 3220 

inpucs ATTCCCATCGCCACCAGGAGCGGCAACCGCCTACTGAAGCTGAGGGACTTCCTCACGGACGAGGCGAACA 
• ••••••«•*••*••• * ••«••«•«••* « •••• ••• 

GTGCCCATCGCCACCAGGGGTGGCAACCGCCTGCTGATGTTGAGGGACTTCTTC^ 

3060 3070 3080 3090 3100 3110 3120 

3230 3240 3250 3260 3270 3280 3290 

inpucs CGTCCTGTAACATCTGGGGCAATAGCACTCSAGTACCGGCCCACCCCAGTGGAGGAAGA^ 

• ••••• «■•••• «* •••••••« « • 

d^TCCTGTAACATCTGGGGGAACAGCACAGAOTACAGGJ^ 

3130 3140 3150 3160 3170 3180 3190 

3300 3310 3320 3330 3340 3350 336C 

inpucs TCCACAGCTGAATCy^CAGCAACTCTGATGTCGTCTCCATCAACTGCiU^ATACGGCT^ 

CCCACAGAGGAATCACAGCAACTCCGACGTGGTC^ 

3200 3210 3220 3230 3240 3250 3260 

3370 3380 3390 3400 3410 3420 343C 

inputs GAAATCAATTTCCATCTACTGGGGAACCTGTGGTTGAGGTCCCTAAAAGCA 



GAGACCAGCTTCTACCTGGTGGGAAACCTGTGGCTGACATCTCTGAAAGCACTCAAGTACAGGTCTCT^^ 
3270 3280 3290 3300 3310 3320 3330 

3440 3450 3460 3470 3480 3490 3500 

inpucs AAATCATGGTCAACGCAGCCTTGCAGAGGCAGTTCCACAGCCCCTTCATCTTCCGTGAGC^ 



AGATCACAGTCAACGCCGCCTTGCAGAGGCAGTTCCACAGCCCCTTCATCTTCC^ 

3340 3350 3360 3370 3380 3390 3400 

3510 3520 3530 3540 3550 3560 3570 

inpucs CCGCCAGATCGTGTTTGAGATCntrCAAGCAAGAGGACTGGCA^^ 



CCGCCAGGTCACATTTGAGATCTCCAAGCAAGAAGACTGGCAGGTCCC 

3410 3420 3430 3440 3450 3460 3470 

3580 3590 3600 3610 3620 3630 3640 



AClXrrGGGGGGCCTCTTGCTGCrGGCCCTGCTGGTCCTGGCACT^^ 

3480 3490 3500 3510 3520 3530 3540 

3650 3660 3670 3680 3690 3700 3710 

inpucs CCAGGCGCAGGAGGGAGCCTGGTCTGGACCCCACCCCCAAAGTGCTGGAGTGAGGCTCCAGAGGAGAC^ 



CCAAGCGCAAGAGGGAACCTGGCCTAGGCCCCATCCCCAAAGAGCrC^ 

35iO. 3560 3570 3580 3590 3600 3610 

FIG. 7E 



3720 3730 3740 3750 3760 3770 376 

inpucs TGAGTTGATGGGGGCCAGGACACCAGTCCAGGTAGTGTTGAGACCCAGGCCTGTGGCCCCACCGAGC^ 

CAAGTTGTTGGGGGCCCG - ACACCAGTCCGGG-GGTGTGCAGGCCCGGGC -TATGGCCTCA- -GAGCTG 
3620 3630 3640 3650 3660 3670 



3790 3800 3810 3820 

inpucs AGCGGACauSGAAGCCAGCTGGCTTTGCACTTGACCTCATCTCCC 



3830 



3840 



38f 



AGCAAAGAGGACACCCATGGACTTTACA-TTGAGTTCATCTCTGGAGC^ 

3680 3690 3700 3710 3720 3730 3740 

3860 3870 3880 3890 3900 3910 392 

inpucs ATGGAACTCAAGCTGGTTTTAAGTGGAACTGCCCTACTGGGAGACTGGGACACCTTTAACAO^ 

ATOGACCTCCAGCCCGTGTTCGGAGTGAC'^^ 
37S0 3760 3770 3780 3790 3800 3810 

3930 3940 3950 3960 3970 3980 

inpucs AGGGATTTAAAGGGACACCCCTACACACACCCAGGCCCACGCCAAGGCCT-CCCTCA-^^ 



AAGGACTAAAAGGGA CCCT- 

3820 3830 



— CCAAGACCCAC-CGGTGGCCTTCCCCC 

3840 3850 3860 



387C 



3990 4000 4010 4020 4030 4040 4050 

inpucs GGCATTTGCTGCCCCAGCTACTAAGGTGCTAGGAATTCGTAATCATCC^ 

•••• •••• 

rCCA-CCTCTGAAGAAACTCA; 
3880 3890 3900 3910 3920 3930 39< 

4060 4070 4080 4090 4100 4110 4120 

inpucs GAGGAAGACTGTAAATACGAACCCAATCTGCACACTCCAGGCCTCTAGTTCC^ 



G-GGAAGCTAGCAAATACGAGCCCACTGTGCACGC-CCTA*--TCTGGA-CCTATAGC^^ 

3950 3960 3970 3980 3990 4000 

4130 4140 4150 4160 4170 4180 4190 

inpucs ACAGATCTGAATTCTGCCCTTTTCTCTCACCCATCCCACCCCTCCA-TTGGCTCCC^^ 



ATGGCCCGGGAGCATAACCTCCGC -CGCACCC - -CTTACCCTTGCTCTTGGTTCCCAAACCACAGCCA- 
4010 4020 4030 4040 4050 4060 

4200 4210 4220 4230 4240 4250 4260 

inpucs CCCTTCCCCATAGATAGGCCCCTGGGGCTCCTGAAGAATGAACCCAAGAGCAAGGG 

CCCTTCTCCACAGATAGACC 
4070 4080 4090 4100 4110 4120 4130 

4270 4280 4290 4300 4310 4320 4330 

inpucs CTGCAAGCCAGGGATGAAGAAAGACTCTGAGATGTGGAGACTGATGGCCAGGC^^ 



CTGCAGGCCAGTGATGGAAAC ACATCCAGGGAC 
4140 4150 4160 4170 



. -TGTGCCAAATGAACTGG- - - AGGGAATCAGQATG 
4180 4190 4200 



4340 4350 4360 

inpucs TGGACGCTGTCCTGAGATGAGAG 



4370 4380 4390 4400 

•GTAGCCGGGCTCTGCACCCACGTGCATTCACATTGACCGCAACTC 



TGGGTACCTTCCAAACATCAGAAAGCAGCAGGGCTCT CCA- 

4210 4220 4230 4240 



— GCAGTAACCACCACCC 
4250 



FIG. 7F 



4410 4420 4430 4440 4450 4460 4470 

inpucs CACATTCC - -CCCACCAGCTGCAGCCCCTTGCTCTCAGCTGCCAACCCTCCCGGGTCACTTTTGTTCt 
I » » z * * ' m • ••••• ' • • 

CTCAATCCTGCTCTCCAGC~CT-CCCC CGCAGCT CCTCTCAG-CCGC1TTGG7TG; 

4260 4270 4280 4290 4300 4310 

4480 4490 4500 4510 4520 4530 

ijipucs GGTACCTCATG GGAAGC ATGTGGATGACACAATCCCTGGGGCTGTGCATTCCCAC — GTCT! 

^*»*' ** * >• • • • I5» Z Z Z Z Z Z * * * " • 

GGCAACTCGTGCTAGGGAGCCTGAGGAGGATGATAAAAATCC-GTGGCTCTCCGTAC^^ 
4320 4330 4340 4350 4360 4370 

4S40 4550 4560 4570 4580 4590 4600 

inpucs TGCTGCAGCCTGCCCCTAGACATGGACGCACTGGCCTGGCTGCAGCTGGGC^^ 



AACTGCAGCTTGTCCCTGG TAGATGCACTG TGATAG GGAGCCTCTGTTTCrTACATOP 

4390 4400 4410 4420 4430 4440 

4610 4620 4630 4640 4650 4660 4670 

inpucs AGCCTCCCCTCCCTGTATCACCCCCTCCCTACACACACACACACACACAC^^ 

• «■« ■ a a a (a* ■ • • • •••aa««««a»aa*«***«a»»»«a« ••••• 

A^CTACACACACACACACACA(^^ 

4450 4460 4470 4480 4490 4500 451 

4680 4690 4700 4710 4720 4730 4740 

inpucs TCCTTCCCTCATGCCCGC-CAGTGCACAGGGAAGGGCTTGGCCAGCGCTGTT^^ 

• •a* ••• • acaaa a*a«« a*«**a«a*a« •••••• 

ACCATCA-GCGTGTGGcbjGAAGGGCTCCTGTAGG^ GCGCTGTGGGGGG CCTTCTAG 

4520 4530 4540 4550 4560 

4750 4760 4770 4780 4790 4800 4810 

inpucs ATGGACTGAATAAAGCACGTGCAAGGACTCCCGGAGCCTGTGCAGCCTTG^ 

• a«»** • ••••••• • « aa* • a •••• ••••« 

ATGCACTGAACAAAG^^ 
4570 4580 4590 4600 4610 4620 4630 

4820 4830 4840 4850 4860 4870 4880 

inpuc s CCGGCCCCCAGGACAAGTGGTATGACCAGTGATAATGCCCCAAGGACAAGGGGCGTGCCTGGCGCCCAC 



CCGGCC AGCr CTGGGATAA-GCCCCAAGGACAAGGGGCATGCCGGATGCCCAC 

4640 4650 4660 4670 4680 

4890 4900 4910 4920 4930 4940 

inpucs GGAGTAATTTATGCCTTAGTCTT G 'rTTTGAGGTAGAAATG CAAGGGGGACACATGAAAGGCATC7 

• •••a*a*«9*a««*«* aa* m aa*«a a aa*««« a* a • • a a* •••• 

AGAGTAAITTAI^CTTAACCT^^ CATCl 

4690 4700 4710 4720 4730 4740 4750 

4950 4960 4970 4980 4990 5000 . 501 

inpucs TCCCC-CTGTGCATAGT — ACGA CCTTTACTGT-CGTATTTTTGAAAAATTAAAAATACAGTGTT 



TTrCATCTGAACAATGTCATCTGTTCCCCTATGCGGTACGACCTTTAC^^ 
4760 4770 4780 4790 4800 4810 4820 

5020 5030 5040 

inpucs AAAAAC'-AAAAAAAAAAAAAAAAGGGCGGCCGC 



ATGTTCTAAAAAAAAAAAAAAAAGGGCGGCCGC Et/^ '^r^ 

4830 4840 4850 rll3« /il 



10 20 30 40 50 60 7< 

inpucs iMDLPRGLWAWALSLWPGFTDTFNMDTRKPRVIPGSRTAFFGYTVQQHDlSGNKWLWGAPLET^ 

• « •••• ««• •••• • ■«•••••••••*■• •••••«*« mm. 

• ••••••••■••■«>•••••••••«••••••••••• ••••■••••••••••••••«•«••«»«, 2 «• 

S , MDFPRGtiLVABm.SLWPGFTDTFNMDTIOTRVIAGPSiyVFFGYT^ 

10 20 30 40 50 60 7* 

80 90 100 110 120 130 14' 

inpucs GDVYKCPVIHGNCTKI^GRVTLSNVSERia^NMRLGLSI^ 



GDVYKCPVTQGNCTKLNI^RVTLSNVSERra 

80 90 100 110 120 130 14( 

150 160 170 180 190 200 21i 

inpucs RVNSNFRFSKTVAPALQRCQTYMDIVIVLDGSNSIYPWVEVQHFLIOTLKKFyi 



RVNSNFRFSKTVAPALQRCQTYMDIVIVUDGSNSIYPWVEVQHFLINILK^^ 

150 160 170 180 190 200 21 

220 230 240 250 260 270 28^ 

inpucs VHEFHI^YRSVKD\A^EAASHIEQRGGTETRTAFGIEF1^EAFQKGGRKGAKK^ 



VHEFKLNDYRSVKDVVEAASKIEQRGGTETRTAFGIEFARSEAFQKGGRKGA^ 

220 230 240 250 260 270 28 

290 300 310 320 330 340 35 

inpucs EKVIQQSERDNVTRYAVAVLGYYimGINPETFI^IKyiASDPDDKOT 



EKVIRQSEKDNVTRYAVAVLGYYinUlGINPETFI^IKYIi^ 

290 300 310 320 330 340 35 

360 370 380 390 400 410 42 

inpucs SLEGTIIKIIETSFGLEMSQTGFSSHVVEDGVLLGAVGAYDWNGAVLK^ 



SLEGTNKNETSFGLEMSQTGFSSHVVEDGIIXGAVGAYDWNGAVLKETSAGKVIPHR^ 

360 370 380 390 400 410 42 

430 440 450 460 470 480 49 

inpucs HGAYLGYTVTSWSSRQGRVYVAGAPRFNHTGKVILFTMHNNRSLTIHQAMRGQQIGSYF^ 



KAAYLGYTVTSWSSRQGRVYVAGAPRFNKTG2C\^F5MKNMRSLTIHQALRGEQIGS^ 

430 440 450 460 470 480 49 

500 510 520 530 540 550 56 

inputs GIXSVTDVLLVGAPMYFNEGRERGKVYVYEIJIQI^^ 



DDRVTDVIXVGAPMYFSEGRERGK\r^VYNLRQNRFVYNGTLKDSHSYQN^ 

500 510 520 530 540 550 56 

570 580 590 600 610 620 63 

inpucs VVGAPLEONKAGAIYIFKGFRGSILKTPKQRITASEIATGLQYFGCSIHGQ 



VVGAPLEDSHRGAIYIFHGFQTNILKKPMQRITASEIAPGLQHFGCSIHGQLDLNEDGL^ 

570 580 590 600 610 620 63 

640 650 660 670 680 690 70 

inpucs VILWSRPWQINASLHFEPSKINIFHRDCKRSGRDATCIJ^LCFTPIFIAPHFQTTTW 



VVLWARPWQINASLHFEPSKINIFHiax:KRNGRDATCIA?l^ 

*640 650 660 670 680 690 70 

FIG. 8A 



710 720 730 740 750 760 77 

inputs RYTPRAHUDEGGDRFTNWWLLSSGQELCERINFHVU^ 

RYMPRAHLDEGCTQFTNR^ 

710 720 730 740 750 760 77 

780 790 800 810 820 830 84 

inputs LRVSVPFWNGCNEDEHCVPDLVLDARSDLPTAMEYCQRVLRKPAQIX:SAYTLSFDTT^ 



LRVSVPFWNGCNEDEHCVTDLVLDARSDLPTAMEYCQRVLGRPAQDCSSYTLSFDTTV^ 

780 790 800 810 820 830 84 

850 860 870 880 890 900 91 

inputs EATLENRGEKAYSTVt^ISQSANI^FASLIQKEDSDGSIECVNEERRLQKQVCW 



EATLENRGEIIAYSAVLNISQSEMLQFASLIQKDDSDNSZECVNEERRLHKKV^^ 

850 860 870 880 890 900 91 

920 930 940 950 960 970 98 

inputs DFEFSKSIFLHHLEIEUUiiGSDSNERDSTKEDNVAPLRFHLK^^ 



DFEFSKSVFLHHLQIHIXSAGSOSHEQDSTADDOTAIiLRFHLKYEA^ 

920 930 940 950 960 970 98 

990 1000 1010 1020 1030 1040 105 

inputs GIGPPFSCIFKIQNX^FPIHGMMMKITIPIATRSGMIUXmU)FLTDE^ 



GIGPPFNCVFKVQOT-GFFPIHGVMMKITVPIATRGGiniLIilLRDFFTDQGOT 

990 1000 1010 1020 1030 1040 105 

1060 1070 1080 1090 1100 1110 112 

inputs DrJWAPQUWSNSDWSINCNIRLVPNQEINFHU-GN^^ 



DLSHAPQRimSNSDWSIICNLRIJVPSQETSFYLVGNLWLTSLKALKYRSLK^ 

1060 1070 1080 1090 1100 1110 112 

1130 1140 1150 1160 1170 1180 

inputs EEDPSRQIWEISKQEDWQVPIWIIVGSTLGGLUXJU^LVZJa 

EmPSRQVTFEISKQEOT 

1130 1140 1150 1160 1170 1180 



FIG. 8B 



int alpha_rpt: domain 1 of 5, from 37 to 90: score 29.5, E = 7,6e-05 

* -pgsyFGysvagvgDlngDksGypDl llvGAPr GaVYvyf 

++FGy+v +D+ G + 1+VGAP+++H-+ +++G VY+++ 

T259 37 RTAFFGYTVQ-QHDIS GNKM-LWGAPLetngyqktGDVYKCP 77 



gssnsgggrciplqnls< - * 
+ g+c+ 1 + 

T259 78 VI HGNCTKLNLGR 90 



Figure 9 A 



>int_alpha_rpt: domain 2 of 5, from 421 to 472: score 19.2, E « 0.097 

* -pgsyFGysvagvgDlngDksGypDlllvGAPr GaVYvyf gs an 

4.g+y+Gy+v++v+ ++++GAPr +++G+V + 

T259 421 HGAYLGYTVTSWSS RQGRVYVAGAPRf nhtGKVILFTMHN- 461 

sgggrciplqnls< - * 

T259 462 - -NRSLTIHQAMR 472 



Figure 9B 



>iat_alpha_rpt: domain 3 of 5, from 476 to 532: score 48.4, E » l.Se-10 

* -pgsyFGysvagvgDlngDksGypDlllvGAPr GaVYvyf 

+g8yFG+ ++ +D++gD G +D+llvGAP+ ++++-i-+G+VYvy 
T259 476 IGSYFGSEIT-SVDIDGD- -GVTDVLLVGAPMyf negrerGKVYVYE 519 

gs snsgggr c ip Iqnl s < - * 
+ +r+ + +1 
T259 520 LR QNRFVYNGTLK 532 



Figure 9C 



>iat_alpha_rpt: domain 4 of 5, from 538 to 593: score 62.6, E =» 8.4e-15 

* -pgsyFGysvagvgDlngDJcsGypDlllvGAPr GaVYvyf gas 

++++FG+8+a+v+Dln+D +y+D ++vaAP++++-i- Ga^Y"i-«-«i^ + 
T259 538 QNARFGSSIASVRDLNQD--SYND-VWGAPLednhaGAiyiFHGFR 581 



nsgggrciplqnls<-* 
+ + +p q ++ 
T259 582 G--SILKTPKQRIT 593 



Figure 9D 



>int_alpha_xpt: domain 5 of 5, from 600 to 654: score 16.5, E » 0.57 

* -pgsyFGysvagvgDlngDksGypblllvGAPr GaVYvyf gss 

yFG s+ g Din D G D 1+vGA +-•• 4.v+++-f+ 
T259 600 Gi:iQYFGCSIHGQLDLNED--GIiI0-LAVGALGnavilWSRPWQI2lll 643 

n8gggrciplqnls< - * 
++++-fp+ + + 
T259 644 - - -SLHFEPSKINI 654 



Figure 9E 
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